1
Contrastando Paradigmas de Utilização de Dados: O Espectro de Etiquetagem
EvoClass-AI003Aula 10
00:00

Contrastando Paradigmas de Utilização de Dados: O Espectro de Etiquetagem

O sucesso na implantação de modelos de aprendizado de máquina depende criticamente da disponibilidade, qualidade e custo dos dados etiquetados. Em ambientes onde a anotação humana é cara, inviável ou altamente especializada, os paradigmas tradicionais tornam-se ineficientes ou falham completamente. Apresentamos o espectro de etiquetagem, distinguindo três abordagens principais com base em como utilizam as informações:Aprendizado Supervisionado (AS), Aprendizado Não Supervisionado (ANS), e Aprendizado Semi-Supervisionado (ASS).

1. Aprendizado Supervisionado (AS): Alta Fidelidade, Alto Custo

O AS opera em conjuntos de dados onde cada entrada $X$ é explicitamente associada a uma etiqueta verdadeira conhecida $Y$. Embora esta abordagem geralmente alcance a maior precisão preditiva para tarefas de classificação ou regressão, sua dependência de rótulos densos e de alta qualidade é intensiva em recursos. O desempenho degrada drasticamente se os exemplos rotulados forem escassos, tornando este paradigma frágil e frequentemente economicamente insustentável para conjuntos de dados massivos e em evolução.

2. Aprendizado Não Supervisionado (ANS): Descoberta de Estruturas Ocultas

O ANS opera exclusivamente com dados não rotulados, $D = \{X_1, X_2, ..., X_n\}$. Seu objetivo é inferir estruturas intrínsecas, distribuições de probabilidade subjacentes, densidades ou representações significativas dentro do manifold dos dados. Aplicações-chave incluem agrupamento, aprendizado de manifold e aprendizado de representações. O ANS é altamente eficaz para pré-processamento e engenharia de características, fornecendo insights valiosos sem depender de entrada humana externa.

Questão 1
Qual paradigma de aprendizado foi especificamente projetado para mitigar a alta dependência da anotação humana cara, utilizando dados não rotulados abundantes?
Aprendizado Supervisionado
Aprendizado Não Supervisionado
Aprendizado Semi-Supervisionado
Aprendizado por Reforço
Questão 2
Se a tarefa principal de um modelo é redução de dimensionalidade (por exemplo, encontrar os componentes principais) ou agrupamento, qual paradigma é universalmente empregado?
Aprendizado Supervisionado
Aprendizado Semi-Supervisionado
Aprendizado Não Supervisionado
Aprendizado por Transferência
Desafio: Definindo o Objetivo do ASS
Conceituando a Função de Perda Combinada
Diferentemente do AS, que otimiza apenas com base na fidelidade dos rótulos, o ASS exige uma estratégia de otimização equilibrada. A perda total deve capturar a precisão das previsões no conjunto rotulado ao mesmo tempo que impõe consistência (por exemplo, suavidade ou separação de baixa densidade) no conjunto não rotulado.

Dado: $D_L$: Dados Rotulados. $D_U$: Dados Não Rotulados. $\mathcal{L}_{SL}$: Função de Perda Supervisionada. $\mathcal{L}_{Consistência}$: Perda que impõe suavidade nas previsões sobre $D_U$.
Passo 1
Escreva a forma geral do objetivo de otimização total $\mathcal{L}_{SSL}$, incorporando um coeficiente de ponderação $\lambda$ para o componente de consistência dos dados não rotulados.
Solução:
A forma conceitual da perda total do ASS é uma soma ponderada dos dois componentes: $\mathcal{L}_{SSL} = \mathcal{L}_{SL}(D_L) + \lambda \cdot \mathcal{L}_{Consistência}(D_U)$. O escalar $\lambda$ controla o trade-off entre fidelidade dos rótulos e dependência da estrutura.